雑談用 LLM モデル
雑談の LLM
from Anxiety
モデル
google のモデルは向いてない気がするな 性能はいいんだけど
qwen3 4b
回答はそこそこだけど遅いな
思考系はくどいから使わない
Reasoning, Thinking とかは避ける
1 リクエストのトークン大体
user入力: 20〜100 tokens
system prompt: 100〜500 tokens
会話履歴: 500〜3000 tokens
AI出力: 100〜300 tokens
1000 回やっても 100 円超えないくらい?
OpenRouter